from lxml import etree

import requests
import lxml
url = 'https://movie.douban.com/top250?start={}&filter='.format(0)

html = requests.get(url).content.decode('utf-8')  # 使用request库获取网页内容

selector = etree.HTML(html)  # 使用lxml库提取内容
'''
    通过观察页面就能发现内容在<div class="info">下的一部分
'''
content = selector.xpath('//div[@class="info"]/div[@class="bd"]/p/text()')
print(content)

for i in content[1::2]:
    print(str(i).strip().replace('\n\r', ''))
    # print(str(i).split('/'))
    i = str(i).split('/')
    i = i[len(i) - 1]
    key = i.strip().replace('\n', '').split(' ')  # 这里的strip和replace的使用目的是去除空格和空行之类
    print(key)